首页> 外文OA文献 >Feature extraction for speech and music discrimination
【2h】

Feature extraction for speech and music discrimination

机译:语音和音乐识别的特征提取

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Driven by the demand of information retrieval, video editing and human-computer interface, in this paper we propose a novel spectral feature for music and speech discrimination. This scheme attempts to simulate a biological model using the averaged cepstrum, where human perception tends to pick up the areas of large cepstral changes. The cepstrum data that is away from the mean value will be exponentially reduced in magnitude. We conduct experiments of music/speech discrimination by comparing the performance of the proposed feature with that of previously proposed features in classification. The dynamic time warping based classification verifies that the proposed feature has the best quality of music/speech classification in the test database.
机译:在信息检索,视频编辑和人机界面的需求驱动下,本文提出了一种新颖的音乐和语音识别频谱特征。该方案尝试使用平均倒谱来模拟生物学模型,在此情况下,人类的感知倾向于吸收大的倒谱变化区域。远离平均值的倒谱数据的幅度将呈指数下降。我们通过比较建议的功能与以前建议的功能在分类中的性能来进行音乐/语音辨别的实验。基于动态时间扭曲的分类可验证所提出的功能在测试数据库中具有最佳的音乐/语音分类质量。

著录项

  • 作者

    Zhou, H; Sadka, A H; Jiang, M;

  • 作者单位
  • 年度 2008
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"en","name":"English","id":9}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号